الگوریتم های "یادگیری ماشین مینیمالیستی" تصاویر را از داده های بسیار کمی تجزیه و تحلیل می کنند
نوشته شده توسط : vacumblupom@gmail.com

ریاضیدانان آزمایشگاه ملی لورنس برکلی وزارت انرژی (آزمایشگاه برکلی) رویکرد جدیدی را برای یادگیری ماشین با هدف داده های تصویربرداری تجربی ایجاد کرده اند. این روش جدید به جای تکیه بر ده ها یا صدها هزار تصویر استفاده شده توسط روش های معمول یادگیری ماشین ، خیلی سریعتر "یاد می گیرد" و به تصاویر بسیار کمتری احتیاج دارد.


دانیل پلت و جیمز ستیان از مرکز آزمایشگاه پیشرفته ریاضیات آزمایشگاه برکلی برای برنامه های تحقیقاتی انرژی (CAMERA) با ساختن آنچه که آنها "شبکه عصبی تحریک متراکم متراکم متراکم (MS-D)" می نامند ، چشم انداز یادگیری معمول دستگاه را روی سر خود چرخاند. پارامترهای بسیار کمتری نسبت به روشهای سنتی ، به سرعت همگرا می شود و توانایی "یادگیری" از یک مجموعه آموزشی قابل ملاحظه ای کوچک را دارد. رویکرد آنها قبلاً برای استخراج ساختار بیولوژیکی از تصاویر سلولی مورد استفاده قرار گرفته است ، و برای تهیه ابزار جدید محاسباتی جدید برای تجزیه و تحلیل داده ها در طیف گسترده ای از مناطق تحقیقاتی آماده شده است.

از آنجا که امکانات آزمایشگاهی تصاویر با وضوح بالاتر را با سرعت بالاتر تولید می کنند ، دانشمندان می توانند برای مدیریت و تجزیه و تحلیل داده های بدست آمده تلاش کنند ، که اغلب با دست و پا گیر انجام می شود. در سال 2014 ، Sethian CAMERA را در آزمایشگاه برکلی به عنوان یک مرکز جامع و انضباطی یکپارچه برای توسعه و تحویل ریاضیات اساسی جدید مورد نیاز برای به دست آوردن تحقیقات تجربی در تأسیسات کاربری دفتر DOE تأسیس کرد. CAMERA بخشی از بخش تحقیقات محاسباتی آزمایشگاه است.

ستیان ، که همچنین استاد ریاضیات در دانشگاه کالیفرنیا ، برکلی است ، گفت: "در بسیاری از کاربردهای علمی ، کار دستی فوق العاده ای برای حاشیه نویسی و برچسب زدن تصاویر لازم است. می تواند هفته ها طول بکشد تا تعداد انگشت شماری از تصاویر با دقت ترسیم شده تولید شود." "هدف ما توسعه تکنیکی بود که از مجموعه داده های بسیار ناچیز آموخته می شود."

جزئیات این الگوریتم در 26 دسامبر 2017 در مقاله ای در مجموعه مقالات آکادمی ملی علوم منتشر شد .

پالت ، که همچنین عضو گروه تصویربرداری محاسباتی در Centrum است ، گفت: "این دستیابی به موفقیت نتیجه گرفته است از این واقعیت که پایین آمدن و بالا آمدن صعودی از ویژگی های ضبط شده در مقیاس های مختلف تصویر ، می توان با استفاده از حلقوی های ریاضی با مقیاس های مختلف در یک لایه جایگزین شد." Wiskunde & Informatica ، موسسه تحقیقات ملی ریاضیات و علوم رایانه در هلند.

برای دسترسی به این الگوریتم برای طیف گسترده ای از محققان ، یک تیم برکلی به سرپرستی اولیویا جاین و سیمون مو یک پرتال وب "Segmenting Labeled Image Data Engine (SlideCAM)" را به عنوان بخشی از مجموعه ابزارهای کامرا برای امکانات آزمایشگاهی DOE ساختند.

تصاویر توموگرافیک از یک مینی کامپوزیت تقویت شده با فیبر ، با استفاده از 1024 پیش بینی (الف) و 120 پیش بینی (ب) بازسازی شده است. در (c) ، خروجی شبکه MS-D با تصویر (b) به عنوان ورودی نشان داده شده است. یک ناحیه کوچک نشان داده شده توسط یک مربع قرمز در گوشه پایین سمت راست هر تصویر بزرگ نشان داده شده است. اعتبار: دانیل پلت و جیمز ستیان ، آزمایشگاه برکلی
یک برنامه امیدوارکننده در درک ساختار داخلی سلولهای بیولوژیکی و پروژه ای است که در آن روش MS-D پالت و Sethian فقط برای داده های هفت سلول برای تعیین ساختار سلول نیاز به داده دارد.



"در آزمایشگاه ما در تلاشیم تا درک كنیم كه ساختار سلول و مورفولوژی سلول چگونه بر سلول اثر می گذارد یا كنترل می كند. ما ساعتهای بی شماری را برای استخراج ساختار سلول ها انجام می دهیم. گفت کارولین لارابل ، مدیر مرکز ملی توموگرافی اشعه ایکس و استاد دانشگاه دانشکده پزشکی سان فرانسیسکو کالیفرنیا. "این رویکرد جدید این توانایی را دارد که توانایی ما را در درک بیماری بطور اساسی تغییر دهد و ابزاری اساسی در پروژه جدید ما با حمایت Chan-Zuckerberg برای ایجاد یک اطلس سلول انسانی است ، یک همکاری جهانی برای نقشه برداری و توصیف همه سلول ها در یک انسان سالم. بدن "

دریافت اطلاعات علمی کمتر از داده های کمتر

تصاویر در همه جا هستند. تلفن های هوشمند و سنسورها گنجینه ای از تصاویر را تولید کرده اند که بسیاری از آنها با اطلاعات مربوط به شناسایی محتوا برچسب خورده اند. با استفاده از این بانک اطلاعاتی گسترده از تصاویر با مراجعه متقاطع ، شبکه های عصبی حلقوی و سایر روشهای یادگیری ماشین ، توانایی ما در شناسایی سریع تصاویر طبیعی که مانند عکسهایی که قبلاً دیده شده و فهرست شده بودند ، متحول شده است.

این روش ها با تنظیم یک مجموعه فوق العاده بزرگ از پارامترهای داخلی پنهان ، هدایت شده توسط میلیون ها تصویر برچسب خورده ، و نیاز به مقادیر زیادی از زمان ابر رایانه "یاد می گیرند". اما اگر تعداد تصاویر دارای برچسب زیادی ندارید ، چه می کنید؟ در بسیاری از زمینه ها ، چنین بانک اطلاعاتی یک تجملات غیرقابل تحقق است. زیست شناسان تصاویر سلولی را ضبط می کنند و با زحمت مرزها و ساختار را به صورت دستی ترسیم می کنند: برای یک فرد غیر معمولی نیست که هفته ها با یک تصویر کاملاً سه بعدی بگذرد. دانشمندان مواد از بازسازی توموگرافی برای همسایه کردن سنگها و مواد استفاده می کنند ، و سپس آستین های خود را برای برچسب زدن مناطق مختلف ، مشخص می کنند تا ترک ها ، شکستگی ها و حفره ها را با دست مشخص کنند. تضاد بین ساختارهای مختلف اما مهم اما اغلب بسیار کوچک و "سر و صدایی" است

این تصاویر گرانبهای دستی که دستی ندارند ، برای روشهای سنتی یادگیری ماشین کافی نیستند. برای رفع این چالش ، ریاضیدانان CAMERA به مسئله یادگیری ماشین از مقادیر بسیار محدود داده حمله کردند. تلاش برای انجام "بیشتر با کمتر" ، هدف آنها این بود که بفهمیم چگونه می توان یک مجموعه کارآمد از "عملگرهای" ریاضی ساخت که می تواند تعداد پارامترها را به میزان زیادی کاهش دهد. این عملگرهای ریاضی به طور طبیعی می توانند محدودیت های کلیدی را برای کمک به شناسایی داشته باشند ، از جمله اینکه شامل الزامات مربوط به اشکال و الگوهای علمی قابل قبول باشد.

 





:: بازدید از این مطلب : 100
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0
تاریخ انتشار : دو شنبه 26 خرداد 1399 | نظرات ()
مطالب مرتبط با این پست
لیست
می توانید دیدگاه خود را بنویسید


نام
آدرس ایمیل
وب سایت/بلاگ
:) :( ;) :D
;)) :X :? :P
:* =(( :O };-
:B /:) =DD :S
-) :-(( :-| :-))
نظر خصوصی

 کد را وارد نمایید:

آپلود عکس دلخواه: